Aller au contenu

Karen Spärck Jones

Un article de Wikipédia, l'encyclopédie libre.
Karen Spärck Jones
Spärck Jones, été 2002
Biographie
Naissance
Décès
(à 71 ans)
Willingham, Cambridgeshire
Nationalité
Formation
Activités
Conjoint
Roger Needham (à partir de )Voir et modifier les données sur Wikidata
Autres informations
A travaillé pour
Membre de
Directeurs de thèse
Site web
Distinction
ACL Lifetime Achievement Award, BCS Lovelace Medal, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit

Karen Spärck Jones née le à Huddersfield et décédée le est une scientifique britannique, chercheuse en informatique. Ses travaux concernent le domaine de l'intelligence artificielle, et principalement le traitement automatique du langage naturel et la recherche d'information.

Karen Spärck Jones est la fille de Owen Jones, maître de conférence (lecturer) en chimie, et Ida Spärck, une Norvégienne ayant déménagé en Grande-Bretagne durant la Seconde Guerre mondiale. Spärck Jones a fait ses études dans un lycée (grammar school) puis au Girton College de Cambridge de 1953 à 1956 où elle étudie l’histoire puis la philosophie. Elle y rencontre la responsable de l’Unité de recherche linguistique de Cambridge, Margaret Masterman, avec qui elle travaille pour faire comprendre aux ordinateurs le langage humain. Son travail établit la base des moteurs de recherche comme Google.

Son article publié en 1964 Classification de la synonymie et sémantique est désormais considéré comme un document fondamental dans le domaine du traitement du langage naturel[1].

En 1972, elle publie dans Journal of Documentation un article qui donne les bases des moteurs de recherche en combinant les statistiques et la linguistique et qui indique de quelles manières les ordinateurs interprètent les relations entre les mots[1]. Il s'agit d'une pondération par « spécificité de terme » dans une recherche d'information, ultérieurement dénommée « fréquence de document inverse » (FDI). L'intuition de cette méthode est qu'un mot apparaissant dans de nombreux documents n'est pas un discriminateur valable. Ce concept est utilisé aujourd'hui dans la plupart des moteurs de recherche, le plus souvent dans le cadre de la méthode TF-IDF[2].

« La spécificité d'un terme peut être quantifiée comme une fonction inverse du nombre de documents dans lesquels il apparaît. » — K. Spärck[3]

À partir de 1974, elle travaille au laboratoire d'informatique de l'université de Cambridge. Dans les années 1980, elle travaille sur les systèmes de reconnaissance vocale précoce. En 1982, le gouvernement britannique lui demande de travailler sur le programme Alvey, un programme visant à promouvoir les recherches en informatique. En 1993, elle co-écrit avec Julia Galliers un article sur les systèmes de traitement du langage naturel. Elle obtient le poste de professeure d'informatique et information à l'université de Cambridge en 1999. Elle prend sa retraite en 2002.

Elle indique que « L'informatique est trop importante pour être laissée aux hommes »[1].

Karen Spärck Jones est mariée au chercheur en informatique, pionnier de la sécurité logicielle, Roger Needham (1935-2003).

Publications

[modifier | modifier le code]
  • « A statistical interpretation of term specificity and its application in retrieval », Journal of Documentation, vol. 28, no 1,‎ , p. 11–21 (DOI 10.1108/eb026526, lire en ligne)
  • Karen Spärck Jones et Martin Kay, Linguistics and Information Science, Academic Press, 1974, 250 p. (ISBN 0-12-656250-4)

Prix et distinctions

[modifier | modifier le code]

Karen Spärck Jones a reçu plusieurs prix et distinctions[4] au cours de sa carrière, dont :

Microsoft et la British Computer Society (décernent conjointement le BCS IRSG Karen Spärck Jones Award[5] depuis 2009 pour récompenser les découvertes dans l'amélioration de la recherche d'information et le traitement du langage naturel.

Notes et références

[modifier | modifier le code]
  1. a b et c (en-US) « Overlooked No More: Karen Sparck Jones, Who Established the Basis for Search Engines », The New York Times,‎ (ISSN 0362-4331, lire en ligne, consulté le )
  2. (en) Stephen Robertson, « Understanding Inverse Document Frequency: On theoretical arguments for IDF », Journal of Documentation, vol. 60, no 5,‎ , p. 503–520 (ISSN 0022-0418, DOI 10.1108/00220410410560582, lire en ligne).
  3. Traduction libre de « The specificity of a term can be quantified as an inverse function of the number of documents in which it occurs. » extrait de Spärck Jones, K. (1972). « A Statistical Interpretation of Term Specificity and Its Application in Retrieval », Journal of Documentation, 28: 11–21. CiteSeerX 10.1.1.115.8343. doi:10.1108/eb026526
  4. (en) Stephen Robertson et Peter Willett, « In memoriam: Karen Spärck Jones », sur Journal of Documentation (DOI 10.1108/jd.2007.27863eaa.001, consulté le )
  5. « KSJ Award », sur irsg.bcs.org (consulté le )

Liens externes

[modifier | modifier le code]